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摘 要 : [目的 /意义 ] 


为 了 提高 体 尺 关键 点 定位 准确 率 ， 
分 割 后 局 部 点 云 定位 测量 关键 点 ， 以 减少 点 云 之 间 相 互 干扰 。 然 而 点 云 分 割 网 络 通常 需要 消耗 较 大 计算 资源 ， 目 


猪 三 维 点 云 体 尺 自动 测量 方法 会 采用 点 云 分 割 ， 在 各 个 


现 有 测量 点 定位 效果 仍 有 竺 提升 空 间 。 本 研究 旨 在 通过 设计 关键 点 生成 网 络 从 猪 体 点 云 中 提取 出 各 体 尺 测量 所 需 
关键 点 。 在 降低 显存 资源 需求 的 同时 提高 测量 关键 点 定位 效果 ， 提 高 体 尺 测量 的 效率 和 精度 。[ 方 法 ] 针对 猪 三 维 
表面 点 云 进行 体 尺 测量 ， 提 出 了 一 种 定位 猪 体 尺 关键 点 的 模型 Pig Back Transformer。 模 型 分 为 两 个 模块 ， 分 别 设 


计 了 两 种 改进 的 Transformer 自 注意 力 编码 器 ， 第 一 模块 为 
法 用 于 获取 边缘 点 ， 再 使 用 edge encoder 编码 右 以 边缘 点 集合 


全 局 关键 点 模块 ， 首 先 设 计 了 一 种 猪 背 部 边缘 点 提取 算 
EAHA, edge encoder 的 edge attention 中 加 入 了 边 


缘 点 和 质点 的 偏 移 距离 信息 ; 第 二 模块 为 关键 点 生成 模块 ， 使 用 了 back attention 机 制 的 back encoder， 其 中 加 入 了 


与 质心 和 第 一 模块 生成 的 全 局 关键 点 的 偏 移 量 ， 并 将 偏 移 量 与 点 云 注意 力 通过 按 位 max pooling 操 作 结 合 ， 


最 后 通 


过 生成 猪 的 体 尺 测量 关键 点 和 背 疹 走向 点 。 最 后 设计 了 使 用 关键 点 和 背 誉 走向 点 作为 输入 的 体 尺 算法 。[ 结 果 和 讨 


论 ] 对 比 关 键 点 利 


背 闪 走向 点 生成 任务 上 Pig Back Transformer 表现 最 佳 ， 并 对 比 体 尺 计算 结果 与 人 工 测 量 结果 ， 


体 长 相对 误差 为 0.63%， 相 对 PointNet++ Point Transformer V2, Point Cloud Transforme, OctFormer PointTr 等 模型 


有 较 大 提升 。[ 结 论 ] Pig Back Transformer 能 相对 准确 地 生成 猪 体 尺 关键 点 ， 


提高 体 尺 测量 数据 准确 度 ， 并且 通过 


点 云 特征 定位 体 尺 关键 点 节省 了 计算 资源 ， 为 无 接触 牲畜 体 尺 测量 提供 了 新 思路 。 
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培育 优良 种 猪 和 控制 生猪 最 佳 出 栏 时 间 是 畜牧 
业 关 注 的 重要 问题 ， 特 定时 间 段 的 猪 表 型 体 尺 测 量 
是 种 猪 培育 和 生猪 出 栏 的 关键 参考 点 。 表 型 体 尺 量 
化 地 描述 了 猪 体外 部 特征 、 表 型 特征 、 发 育 情况 
等 。 体 尺 表 型 值 常 可 作为 育种 时 的 遗传 参数 ， 亦 可 
以 作为 育肥 潜力 的 参考 用 以 控制 最 佳 出 栏 时 间 。 目 
前 猪 表 型 体 尺 数据 获取 的 常规 方法 主要 是 人 工 测量 
法 ， 然 而 人 工 测量 费时 费力 、 效 率 低下 、 同 时 结 
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受到 测量 人 员 专 业 素 养 的 主观 性 影响 ， 且 测量 过 程 
容易 引发 性 畜 应 激 反 应 ， 并 有 可 能 对 测量 人 员 造 成 


人 身 伤害 ， 目 前 大 规模 人 工 测量 已 经 不 能 满足 现代 
大 型 养殖 场 的 需求 。 


随 着 计算 机 视觉 的 发 展 ， 牲 冀 体 尺 的 无 接触 测 
量 方法 越 来 越 引 起 重视 ， 其 技术 也 经 历 过 了 多 次 改 
变 和 发 展 。 最 初 的 研究 是 使 用 彩色 相机 获取 猪 单 视 
角 下 的 二 维 彩色 图 像 ， 通 过 对 二 维 图 像 的 分 析 和 计 
算 获 取 牲 畜 体 尺 或 进行 体重 估计 。 江 杰 等 "运用 
基于 灰 度 的 背景 差分 法 ,结合 色 度 不 变性 原理 ， 从 
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复杂 环境 中 检测 羊 体 提取 轮廓 包 络 线 ， 并 获取 轮廓 
包 络 线 最 大 曲率 点 作为 羊 体 蔷 部 测 点 ， 采 用 四 点 法 
求 取 羊 体 其 他 3 个 测 点 计算 出 羊 体 的 体 尺 参数 。 
Zhang 等 ”在 获取 羊 只 顶部 和 侧面 图 像 后 ， 使 用 
SLIC (Simple Linear Iterative Clustering) Superpixel 
算法 通过 分 割 提取 图 像 中 的 羊 体 ， 再 分 析 轮 廓 包 络 
线 完 成 羊 的 体 长 、 体 高 等 体 尺 信息 估算 。 

使 用 二 维 视觉 进行 采集 的 无 接触 测量 方法 后 续 
探索 中 开始 出 现 采 用 二 维 图 像 三 维 重建 方法 的 人 研 
究 。Yang 等 ”通过 使 用 二 维 图 像 进行 三 维 重 建 得 
到 点 云 ， 再 进行 奶牛 的 体 尺 测量 ; 奶牛 在 测量 过 程 
中 有 贷 部 被 固定 在 围栏 上 ， 从 奶牛 右 侧 沿 背后 至 左 侧 
连续 采集 图 像 ， 使 用 SIFT (Scale-Invariant Feature 
Transform) 算法 ”进行 图 像 关 键 点 提取 ， 通 过 关 
键 点 确定 相机 位 置 参 数 ， 使 用 位 置 参数 重建 点 云 ， 
经 过 点 云 提取 、 姿 态 归 一 化 和 点 云 补 全 后 ， 通 过 聚 
类 进行 定位 并 计算 体 尺 。 

二 维 图 像 估 算 牲 畜 体 尺 具 有 成 本 低 、 设 备 安装 
简易 等 优势 ， 然 而 二 维 图 像 缺 少 深 度 维度 信息 ， 且 
相机 在 物 距 、 光 照 条 件 改变 时 ， 测 量 结果 都 会 受到 
影响 ， 故 通用 性 较 差 ， 难 以 提升 系统 整体 准确 性 。 

随 着 消费 级 深度 相机 的 广泛 应 用 ， 人 研究 者 逐渐 
转向 使 用 深度 相机 获取 牲畜 的 三 维 表面 点 云 进行 体 
尺 测 量 和 体重 估计 。 深 度 相 机 获取 的 点 云 数 据 包含 
了 X、7、Z 坐 标 和 颜色 等 信息 ， 拓 展 了 牲畜 体 尺 测 
量 的 深度 和 广度 研究 。Salau 等 外 使 用 单 视角 深度 
相机 获取 奶牛 背部 三 维 点 云 ， 分 析 统 计 采 集 点 云 定 
位 体 尺 关键 点 实现 对 奶牛 体 尺 自动 测量 ， 受 到 单 视 
角 的 局 限 ， 该 方法 只 能 对 背部 和 辟 部 部 分 体 尺 进行 
测量 。 叶 文 帅 等 “ 通过 分 析 肉 牛 骨架 特征 和 肉牛 
图 像 边 缘 轮 廓 特征 ,提出 一 种 多 姿态 肉牛 体 尺 自动 
测量 方法 。Ruchay 等 ”使 用 非 刚 性 配 准 提高 配 准 
精度 ， 并 通过 在 牛 体 进行 物理 标记 的 方法 在 采集 的 
图 像 上 得 到 关键 点 进行 测量 。Shi 等 中 提出 了 一 种 
基于 注意 力 的 特征 提取 模型 对 奶牛 进行 了 体 况 评 
分 ， 并 在 体 况 评分 任务 中 取得 了 较 好 的 结果 ; 同时 
构建 了 一 个 由 512 头 奶 牛 构成 的 数据 集 。Hu 等 ” 
尝试 使 用 改进 的 PointNet++ 网 络 对 点 云 做 分 割 ， 平 
均 准 确 度 为 标准 姿态 下 96.41%， 非 标准 姿态 下 
94.98%， 对 分 割 后 的 点 云 进行 关键 点 定位 ， 点 云 各 
部 分 分 制 后 对 猪 的 姿态 变化 有 更 高 的 容忍 度 ， 泛 化 
性 有 所 提升 ， 但 受 限于 定位 点 的 精度 和 定位 点 数 
Ht, 仍然 有 提升 空间 。 

oe LAIR, 采用 牲畜 表面 点 云 进 行 体 尺 计算 


中 ,牲畜 点 云 姿态 多 种 多 样 ， 会 呈现 出 不 同 的 局 部 
特征 ， 使 得 体 尺 测量 中 关键 点 定位 算法 难以 泛 化 应 
用 于 全 部 点 云 中 ""， 这 也 使 得 如 何 能 更 精确 地 通 


采用 消费 级 深度 相机 如 Azure Kinect 等 采集 的 
点 云 具 有 非 结构 化 、 无 序 的 特点 ， 目 前 点 云 处 理 任 
务 如 分 割 、 配 准 、 补 全 、 目 标 检测 等 多 采用 神经 网 
络 实现 ， 其 发 展 从 早期 基于 体 素 的 卷 积 神经 网 络 , 
之 后 的 基于 点 的 卷 积 神经 网 络 ， 如 PointNet"" ， 到 
目前 兴起 的 应 用 于 点 云 的 使 用 自 注意 力 机 制 的 神经 
网 络 如 Point Transformer |’, Fast Point Transform- 
er", Poin-BERT ”。 目 前 的 网 络 设计 目的 多 为 分 
割 和 分 类 ， 这 些 网 络 模型 有 着 优秀 的 提取 点 云 特征 
的 能 力 ， 可 以 修改 后 作为 任务 的 主干 网 络 。 

为 进一步 提升 猪 体 尺 测量 的 精度 ， 且 不 采用 消 
耗 大 量 计算 资源 的 点 云 分 割 模 型 ， 本 研究 设计 了 一 
种 猪 体 点 云 自 注意 力 机 制 网 络 模 型 Pig Back Trans- 
former 进行 测量 关键 点 定位 ， 并 使 用 关键 点 进行 体 
长 、 体 高 、 体 宽 、 腹 于 等 体 尺 数据 的 自动 测算 。 

1 研究 方法 

本 研究 猪 点 云 背 部 关键 点 定位 及 体 尺 测量 算法 
计算 流程 如 图 1 所 示 。 

采集 和 预 处 理 模 块 : 首先 使 用 深度 相机 采集 顶 
部 、 左 侧 、 右 侧 三 个 视角 的 局 部 点 云 ; 再 分 别 将 各 
视角 点 云 中 的 背景 去 除 ， 并 对 局 部 点 云 配 准 后 得 到 
完整 三 维 点 云 ; 之 后 进行 去 噪 、 平 滑 处 理 和 下 采 
FÉ; 最 后 使 用 背部 点 云 边 毕 提取 算法 获得 背部 边缘 
点 云 。 

体 尺 计算 模块 : 背部 边缘 点 和 内 部 点 通过 Pig 
Back Transformer 模 型 生成 背部 测量 关键 点 ， 使 用 
背部 测量 关键 点 和 背 兰 走向 点 结合 背部 点 云 计算 体 
长 ， 结 合 整 体 点 云 计 算 体 高 、 体 宽 、 腹 围 、 胸 围 。 
1.1 采集 和 数据 预 处 理 


本 研究 的 数据 采集 地 点 位 于 广东 省 温 氏 河源 新 
唱 公 司 ， 采 集 猪 种 包括 长 白猪 、 大 白猪 、 杜 洛克 、 
皮特 兰 和 蓝 塘 土 猪 ， 猪 龄 为 160~220 天 。 分 两 次 进 
行 数据 采集 。 第 一 次 于 2020 年 7 月 开始 ， 持 续 30 
天 ; 第 二 次 于 2022 年 7 月 开始 ， 持 续 45 天 。 

第 一 次 采集 ， 猪 只 体重 为 6779—142.67 kg, 
平均 体重 105.28 kg， 体 长 为 100~130 em, 平均 体 
K 115.79 cm， 体 高 为 56~70 cm; 第 二 次 采集 时 ， 
猪 只 体重 为 60~150 kg， 体 长 为 80~140 cm， 体 高 
为 50~90 cm。 


78 智慧 农业 (中 英文 ) Smart Agriculture 


Vol. 6, No. 4 
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Fig. 1 Process flow diagram of pigs point cloud body 


size calculation 


采集 通道 由 两 侧 各 三 根 钢 制 栏杆 构成 ， 宽 度 为 
0.65 m， 长 度 为 2.5 m. 

第 一 次 采集 时 使 用 三 台 Kinect V2 相机 从 通道 
顶部 以 及 两 侧 进行 拍摄 ， 相 机 参数 为 : 深度 图 像 分 
辨 率 像素 为 512X424， 水 平视 角 70"， 垂 直 视 角 
60"， 深 度 范围 0.5~3.5 m。 通 道 顶部 相机 位 于 中 央 
正 上 方 高 度 为 2.2 m 处， 两 侧 相 机 与 地 面相 对 高 度 
为 40 cm， 水 平 间距 为 4.5 m。 

第 二 次 采集 时 使 用 三 台 Azure Kinect 相机 从 通 
道 顶 部 以 及 两 侧 进行 拍摄 ， 相 机 参数 为 深度 图 像 分 
辩 率 像素 为 1024X1024， 水 平视 角 120°, HERA 
fa 120"， 深 度 范 围 0.25~2.21 m。 通 道 顶部 相机 位 
于 中 央 正 上 方 高 度 为 2m 处 ， 两 侧 相 机 与 地 面相 对 
高 度 为 40 cm， 水 平 间 距 为 3 m， 此 次 采集 现场 如 
图 2a 所 示 ， 采 集 设备 摆 放 示意 图 如 图 2b 所 示 。 

第 一 次 采集 得 到 30 头 猪 的 264 组 点 云 ， 去 除 掉 
不 完整 点 云 以 及 样本 量 过 少 的 点 云 后 ， 得 到 20 头 
猪 ， 每 头 猪 10 组 点 云 ， 共 200 组 点 云 ， 每 组 都 包括 


Azure Kinect 


2m 


Azure Kinect 
Azure Kinect 4 
一 一 一 通道 围栏 
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b. 设备 摆 放 示意 图 


图 2 使 用 Azure Kinect 的 猪 体 点 云 采集 通道 现场 
与 设备 摆 放 示意 图 
Fig. 2 Tunnel for pig's point cloud collect using 
Azure Kinect 


了 背部 、 两 侧 和 整体 点 云 ， 并 手工 测量 了 所 有 受 采 
集 猪 只 的 体 尺 长 度数 据 ; 第 二 次 采集 得 到 120 头 猪 
的 1 022 组 点 云 ， 在 去 除 掉 不 完整 点 云 后 ， 保 留 了 
70 头 猪 的 610 组 点 云 ， 每 组 都 包括 了 背部 、 两 侧 和 
整体 点 云 。 

研究 中 进行 了 边缘 提取 、 神 经 网 络 性 能 和 体 尺 
计算 三 部 分 实验 ， 边缘 提取 实验 数据 集 共 810 个 猪 
体 背 部 点 云 ; 关键 点 生成 实验 中 ， 人 工 标记 了 810 
组 点 云 作 为 真 值 ， 每 组 人 工 标记 包括 体 长 测量 起 始 
点 、 前 体高 和 肩 宽 测量 关键 点 、 胸 围 测 量 关键 点 、 
腹 围 和 上 腹 宽 测 量 关 键 点 、 后 体高 和 辟 宽 测量 关键 
点 、 体 长 测量 终点 以 及 24~58 个 根据 体 长 变化 的 背 
桨 走向 点 ， 实 验 输 入 的 数据 集 为 810 个 背部 点 云 、 
各 自 的 边缘 点 和 人 工 标 记 的 真 值 经 过 对 称 、 旋 转 操 
作 进行 数据 增强 得 到 的 共 4 050 组 数据 ， 每 组 包括 
一 个 背部 点 云 和 此 背部 点 云 的 边缘 点 ， 训 练 时 采用 
随机 分 割 策略 ， 数 据 分 为 8 : 1 : 1 的 比例 分 别 用 作 
训练 集 、 验 证 集 、 测 试 集 ; 体 尺 计算 实验 数据 集 选 
取 了 人 工 测 量 过 的 20 头 猪 ， 每 头 10 个 背部 点 云 、 
10 个 完整 点 云 ， 共 400 个 点 云 ; 体 长 分 布 实验 数据 
集 为 从 体 尺 计算 实验 数据 集中 根据 背 浓 走向 曲线 的 
曲率 取 姿 态 变 化 剧烈 的 10 头 ， 每 头 10 个 背部 点 云 ， 
10 个 完整 点 云 ， 共 200 个 点 云 。 
1.14.1 配 准 并 提取 猪 体 点 云 

采集 到 的 点 云 数据 包含 有 背景 ， 需 要 提取 出 猪 
体 目 标点 云 。 提 取 步 又 为 分 别 采集 通道 背景 点 云集 
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合 %， 及 含有 猪 体 的 点 云 9,， 猪 体 目标 点 云 为 9，， 
国 值 为 k,， 如 公式 (1) 所 示 ， 根 据 距 离 背 景点 云 
的 距离 确定 是 否 为 猪 体 ， 与 背景 距离 大 于 效 值 的 点 


为 猪 体 点 云 ， 时 间 复 杂 度 为 o(mn)，m 为 猪 体 点 数 ， 
nn 为 总 点 数 。 
S, = {Vp € $a € S» || peal], < k) (1) 


采集 所 用 的 3 台 深 度 相 机 从 不 同 视角 获取 的 猪 
体 局 部 点 云 位 于 各 自 坐 标 系 中 ， 需 要 统一 到 同一 视 
角 坐 标 系 下 。 本 研究 采用 的 配 准 方 法 如 图 3 所 示 ， 
设 顶 部 相机 为 世界 坐标 系 ， 采 用 刚性 立方 体 配 准 物 
将 左 侧 和 右 侧 摄像 机 的 点 云 变换 到 世界 坐标 系 下 ， 
详细 内 容 参 见 文献 “ 。 


som m 


图 3 Pig Back Transformer 模 型 的 刚性 立方 体 配 准 物 配 准 过 程 


Fig. 3 Registration process of the rigid registration box in Pig 


Back Transformer model 


11.2 Besar 

猪 体 目标 点 云 附 着 有 大 量 噪声 ， 猪 体 点 云 近 点 
噪声 由 猪 体 与 栏杆 之 间 光 线 的 反复 衍射 和 环境 中 灰 
侍 等 因素 产生 ， 噪 声 点 会 对 边缘 提取 和 关键 点 生成 
产生 极 大 的 影响 。 本 研究 采用 统计 滤波 和 半径 滤波 
组 合 的 两 级 滤波 器 对 猪 体 点 云 进行 去 噪 。 

统计 滤波 用 于 去 除 离 群 点 ， 其 原理 为 ， 设 置 邻 
域 点 数量 和 标准 差 ， 设 每 个 点 与 邻近 点 之 间 的 距离 
服从 高 斯 分 布 ， 平 均 距 离 为 均值 ， 可 以 根据 均值 和 
每 一 个 距离 求 得 标准 差 ， 平 均 距 离 在 标准 范围 之 外 
的 点 可 以 被 定义 为 离 群 点 ， 并 从 数据 中 去 除 。 

半径 滤波 器 则 是 用 于 去 除 小 于 猪 体 点 云 密度 的 
噪声 点 云 。 半 径 滤 波 器 以 点 云 中 某 一 点 为 中 心 夯 一 
个 圆 计算 落 在 该 圆 中 点 的 数量 ， 当 数量 大 于 邻 域 点 
BE k, WRES, BUAIR o 
1.1.3 猪 体 点 云 平 滑 

点 云 经 过 去 噪 后 ， 远 点 噪声 和 大 部 分 近 点 噪声 
基本 被 去 除 ， 但 是 贴近 猪 体 表 面 的 部 分 毛刺 噪声 点 
(图 4a) 依旧 没有 去 除 。 这 些 毛刺 噪声 会 造成 猪 体 
点 云 表面 出 现 锐利 区 域 ， 使 后 续 的 点 云 法 向 量 估计 
出 现 偏差 ， 造 成 边缘 点 提取 错误 。 

为 了 解决 上 述 问 题 ， 采 用 局 部 范围 内 移动 最 小 
二 乘法 "将 猪 体 表面 点 云 拟 合 为 平滑 的 曲面 。 点 
云 平 滑 效果 如 图 4b 所 示 ， 基 本 消除 了 表面 的 毛刺 


a 表面 毛刺 点 b. 平滑 后 的 猪 体 点 去 
图 4 使 用 局 部 范围 内 移动 最 小 二 乘法 的 点 云 平 滑 效 果 
Fig. 4 The smoothing effect of point cloud using local range 


moving least squares method 


噪声 。 
1.1.4 背部 边缘 提取 


提取 猪 背 部 轮廓 边缘 的 目的 是 获得 更 加 稳定 的 
全 局 特征 ， 在 使 用 模型 提取 点 云 全 局 几何 特征 时 ， 
三 维 相机 的 成 像 原 理 导致 大 量 点 云集 中 在 背部 的 平 
坦 区 域 。 平 坦 区 域 点 在 神经 网 络 中 提供 的 特征 是 相 
似 的 ， 全 部 输入 网 络 将 造成 计算 资源 浪费 ， 故 本 研 
究 选择 采样 背部 边缘 点 作为 模型 第 一 部 分 的 输入 ， 
不 仅 可 以 获得 稳定 的 全 局 特征 ， 而 且 能 极 大 地 减少 
模型 所 需 的 参数 量 。 

背部 点 云 边缘 提取 算法 先 根据 质点 修整 点 云 ， 
再 计算 每 个 点 的 上 点 法 向 量 并 拟 合法 平面 ， 最 后 对 
每 个 点 的 上 点 在 其 法 平面 上 的 投影 与 其 构成 的 邻 边 
夹 角 判断 是 否 为 边缘 点 。 

顶部 相机 获取 猪 体 点 云 时 ， 由 于 视角 问题 会 
致 如 图 5a 所 示 的 边缘 不 平整 现象 ， 直 接 进 行 边缘 采 
样 会 影响 模型 的 稳定 性 及 拟 合 速度 降低 。 本 研究 将 
背部 点 去 进行 切片 ， 并 计算 切片 质心 ， 将 质心 以 下 
的 点 金 去 。 修 整 后 的 点 云 如 图 Sb 所 示 ， 不 仅 仍然 
能 提供 完整 的 全 局 特征 ， 同 时 还 可 以 使 用 更 少 的 点 
得 到 稳定 的 全 局 特征 。 


a. 未 修剪 的 猪 体 背 部 点 云 b. 修剪 后 的 点 云 
图 5 修剪 前 后 的 猪 体 背 部 点 云 对 比 
Fig. 5 Origin point cloud & trimmed point cloud 


计算 法 平面 时 ， 先 使 用 k-d 树 构建 索引 并 确定 
每 个 点 的 k 近 邻 点 ， 并 根据 近邻 点 使 用 最 小 二 乘 
法 估计 法 平面 。 

在 计算 得 到 点 云 中 每 一 点 的 法 平面 后 ， 还 需 计 
算 点 云 中 每 一 点 和 其 最 近 点 在 法 平面 上 的 投影 构成 
的 邻 边 夹 角 。 由 于 点 去 具有 无 序 性 ， 在 直接 计算 邻 
边 夹 角 时 需要 先进 行 投影 ， 再 经 过 o(ze) 级 时 间 复 
杂 度 的 计算 才能 确定 每 个 邻 边 夹 角 ， 会 额外 消耗 大 


80 智慧 农业 (中 英文 ) Smart Agriculture 


Vol. 6, No. 4 


量 计算 资源 。 

通过 三 个 变换 矩阵 使 当前 进行 判断 的 点 位 于 原 
点 ， 并 使 法 平面 与 xOy 平 面 重合 ， 得 到 变换 后 的 最 
近 点 Zi = TT,T,X,, EZ, MESE SI xOy X rie i 
极 角 ,再 利用 极 角 计算 邻 边 夹 角 以 降低 算法 的 复杂 
度 ， 变 换 过 程 如 图 6 所 示 。 


进行 边 纤 天 定 的 点 一 * 拟 侣 平面 的 法 向 基 
sk 最 近 点 最 近 点 到 拟人 台 平 面 的 重 线 
:最 近 点 在 拟 合 平面 上 的 投影 拟 侣 平面 


图 6 边缘 点 提取 中 的 拟 合 平面 的 变换 过 程 
Fig.6 The transformation process of the fitted plane in edge 


point extraction 


AO PAT, T, 7T; 如 公式 (2) 一 公式 (4) 
所 示 。 


1 0 0 =p, 
7 = 0 1 0 -p, (2) 
0 0 1 -p, 
0.00 1 
cos(a) -sin(a) 0 0 
T,- sin(a) cos(a) 0 0 (3) 
0 0 1 0 
0 0 0 1 
cos(f) 0 sin(f) 0 
om NE LO (4) 
-sin(f) 0 cos(f) 0 


0 0 0 1 

AP: T 为 将 A 平移 到 原点 的 刚性 变换 ; T, 
绕 Z 轴 的 旋转 变换 ; a 为 法 向 量 在 xOy 平 面 的 投影 
和 x 轴 的 夹 角 ; 7; 为 绕 Y 轴 的 旋转 变换 ;为 进行 7， 
变换 后 法 向 量 与 < 轴 的 夹 角 ; 由 于 法 平面 与 xOy 重 
合 ， 此 时 投影 可 以 直接 使 用 Zi 的 x，y 坐 标 ， 此 方 
法 相 比 直接 投影 到 法 平面 再 计算 极 角 拥有 更 低 的 时 
间 复 杂 度 。 

将 Zi 投影 到 xOy 平 面 并 转换 为 极 坐标 ， 得 到 一 
组 极 角 p;， 将 极 角 按 从 小 到 大 排序 ， 相 邻 极 角 差 即 
为 投影 后 的 邻 边 夹 角 ， 投 影 效 果 如 图 7 所 示 ， 红 
色 、 绿 色 、 蓝 色 、 黄 色 依 次 为 被 判别 点 的 各 近邻 点 
投影 到 最 小 二 乘法 平面 后 的 极 角 。 

得 到 极 角 并 从 大 到 小 排序 后 ， 依 次 计算 极 角 差 


边缘 点 ” 非 边缘 点 
a. 猪 体 上 的 边缘 点 与 非 边 缘 点 


b. 边 缘 点 和 邻近 点 的 投影 c. 非 边缘 点 和 邻近 点 的 投影 
图 7 边缘 提取 算法 中 K 近 邻 在 临近 点 拟 合 平面 上 投影 的 极 角 
Fig. 7 The projectiles of k nearest in polar coordinate system in 


edge detection algorithm 
得 到 邻 边 夹 角 。 
设 邻 边 夹 角 为 R.， 则 邻 边 夹 角 计 算 如 公式 (5) 
和 公式 (6) 所 示 。 
Ri pii T Pi (5) 
R, =p, - p, * 2n (6) 
AP: R 为 邻 边 夹 角 ,pp 为 极 角 ， 且 (i= 


1，2，3，…, k- 1). EIERE y, max(R,) > 
7 时 ， 当 前 中 心 点 为 边缘 点 。 
1.2 体 尺 计算 


本 研究 设计 的 体 尺 算 依托 于 Pig Back Trans- 
former 模 型 获得 的 体 尺 关键 点 和 背 兰 走向 点 ， 体 尺 
关键 点 协助 定位 各 体 尺 计算 区 域 ， 背 肴 走向 点 曲线 
拟 合 可 以 进行 体 长 计算 。 

1.2.1 ”改进 的 自 注意 力 Pig Back Transformer 

猪 体 背部 点 云 轮廓 边缘 提取 模型 是 在 Trans- 
former 网 络 基础 上 提出 了 图 8 所 示 的 Pig Back 
Transformer 网 络 结构 。 首 先进 行 点 云 归 一 化 ， 之 后 
将 边 绿 点 云 使 用 最 远 点 采样 到 32 个 点 作为 输入 ， 
经 Edge Embedding 映射 ， 并 通过 Edge Transformer 
模块 提取 特征 后 由 多 层 感知 机 得 到 全 局 特征 点 ， 再 
输入 经 过 尺寸 为 0.01 的 体 素 降 采 样 和 512 个 点 的 最 
远 点 采样 后 的 完整 背部 点 云 ， 并 与 全 局 特征 点 一 起 
通过 Back Embedding RIA, HEH Back Trans- 
former 模 块 提取 特征 ， 最 后 将 特征 通过 多 层 感知 机 
得 到 相对 偏 移 ， 使 用 偏 移 和 全 局 特征 点 求 和 得 到 关 
键 点 。 


Vol. 6, No. 4 


王 宇 啸 等 : 猪 三 维 点 云 体 尺 自动 计算 模型 Pig Back Transformer 81 


(bX32X3) 


Edge 
Embedding 


( bX32X 128 ) 


(bXIX3) 


( bX32X 64 ) 


Back 
Embedding 


(bX512X64 ) 


( bX512X3) 


( bX17X3) 


( bX512X64 ) (bX17X3) 


图 8 本 研究 提出 的 Pig Back Transformer 结构 
Fig. 8 The Pig Back Transformer's structure proposed in this research 


下 文 依次 介绍 Pig Back Transformer 4$ 2H (4 RJ 
设计 。 

1) Be EH A Edge Embedding 和 自 注意 力 
Edge Transformer, 

Edge Embedding 结构 如 图 9 所 示 ， 分 为 两 部 
分 。 第 一 部 分 使 用 PointNett++ ”中 的 多 层 感 知 机 
Shared MLP (Multilayer Perceptron) 进行 映射 , 
Shared MLP 使 用 相同 的 线性 变换 将 点 云 中 的 所 有 点 
映射 到 相同 的 高 维 空间 中 ， 先 经 过 输入 为 3 个 维 
度 ， 和 输出 为 128 个 维度 的 卷 积 ， 再 经 过 输入 为 128 
个 维度 ， 输 出 为 128 个 维度 的 卷 积 得 到 高 维 点 特征 


Edge 
Encoder 


Edge Transformer 


X, X, (FW edge attention 中 生成 Query (Q). 
key (K), Value (V) 矩阵 所 用 的 输入 ; 第 二 部 分 
ftl FERES ia 53 E IER UA JG 9] t £RL TE IER E CAN 
X,, X,2J edge attention 中 生成 0,，K, 所 用 的 输入 。 
fr Edge Embedding 中 添加 距离 舱 入 X, 的 原因 是 相 
对 质心 的 距离 蕴含 了 点 云 的 几何 信息 ， 在 获取 全 局 
关键 点 时 ， 自 注意 力 可 以 根据 了 ,为 不 同 的 点 分 配 
权 值 ， 结 合 使 用 点 云 本 身 的 三 维 位 置信 息 得 到 的 注 
意 力 权重 ,可 以 使 最 终 得 到 的 注意 力 权 重 同时 利用 
到 X, 的 全 局 几何 信息 和 从 三 维 位 置信 息 提取 出 的 局 


部 特征 。 
| 


Distance 
Embedding 


a. Edge Embedding & Edge Transformer 
图 9 Edge Embedding & Edge Transformer 结构 
Fig. 9 Structures of Edge Embedding & Edge Transformer 


Edge Embedding 与 Transformer 采用 了 不 同 的 
设计 。 首 先 没有 采用 与 Transformer 中 相同 的 位 置 编 
但 形式 ， 因 为 Transformer 在 Embedding 步骤 中 直接 
将 位 置信 息 添加 到 了 输入 的 向 量 中 是 为 了 解决 self- 
attention 中 基于 特征 提取 时 会 忽略 序列 顺序 导致 的 
词 序 问题 ， 但 是 self-attention 特征 提取 的 序列 无 关 
性 却 是 适合 解决 点 云 无 序 性 的 关键 ， 所 以 在 进行 网 
络 改进 的 过 程 中 ， 本 文 研 究 选 择 去 除 掉 位 置 编 码 , 
直接 进行 特征 提取 。 

其 次 ，Edge Embedding 中 使 用 Shared MLP 进 
行 提取 的 设计 相对 于 使 用 MLP 减 少 了 大 量 的 训练 
参数 ，Shared MLP 为 输入 点 云集 合 己 训练 矩阵 $ 进 
行 映射 ， 得 到 特征 F = PS, IERT PSREN X 


Edge Encoder 


b. Edge Encoder 


f. 为 特征 的 维度 ， 若 使 用 MLP 进 行 特征 提取 ， 则 
参数 量 为 3 X fX no MLP 相对 Shared MLP 的 优 
点 是 在 进行 信息 提取 时 可 以 将 输入 进行 交叉 ， 而 
Shared MLP 的 信息 提取 是 孤立 的 ， 只 能 提取 到 每 个 
输入 自身 的 高 维 信息 ， 但 是 ， 由 于 在 网 络 的 后 续 设 
计 中 采用 了 Edge Transformer 通 过 edge attention 提 
取 局 部 和 全 局 信息 ， 所 以 选择 使 用 Shared MLP 作 
为 Embedding 步 又 的 特征 提取 器 。 

Edge Transformer 使 用 两 层 编码 器 进行 一 次 降 
采样 的 结构 ， 编 码 器 中 使 用 了 改进 的 edge atten- 
tion， 其 计算 如 公式 (7) 所 示 。 
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量 组 作为 基于 全 集 特征 点 的 偏 移 向 量 组 ， 第 二 部 分 
是 将 偏 移 向 量 组 经 过 线性 映射 至 64 维 得 到 XX,， 第 
三 部 分 是 使 用 背部 点 和 偏 移 向 量 组 构建 距离 嵌入 得 


Attention( X,, x. = 
sm 中 d + sm (X W,)( X. W5 
JD, /D, 
x(x,w.) 
(7) 


式 中 : X,, X2) 228 18 JH Shared MLP 和 距离 
能 入 得 到 的 特征 ; WW 为 权 值 矩阵 ; D 为 维度。 

改进 的 自 注 意 力 机 制 添加 了 与 质点 之 间 的 距离 
信息 ， 补 充 了 点 的 相对 位 置 特征 信息 。 通 过 徐 加 点 
村 征 和 距离 特征 产生 的 自 注 意 力 权 值 ， 能 得 到 更 具 
有 代表 性 的 全 局 特征 。 

Edge Transformer 后 使 用 两 层 的 MLP 将 得 到 的 
特征 转化 为 全 局 特征 点 。 

2) elt HR A Back Embedding 和 自 注意 
Back Transformer, 

Back Embedding 如 图 10 所 示 ， 分 为 三 部 分 ， 
第 一 部 分 是 以 背部 点 与 全 局 特征 点 作 差 ， 得 到 的 向 


Back Embedding Back Transformer 


Distance 
Embedding 


a. Back Embedding & Back Transformer 


图 10 Back Embedding & Back Transformer 结构 
Fig. 10 Structures of Back Embedding & Back Transformer 


猪 的 运动 平面 在 运动 解剖 学 中 将 分 为 冠状 面 、 
矢 状 面 和 横断 面 ， 其 中 冠状 面 平行 于 地 面 ， 高 度 位 
于 猪 消 柱 矢 状 面 牌 直 于 地 面 、 平 行 于 猪 疹 柱 ; 横断 
面 为 同时 垂直 于 地 面 与 猪 消 柱 的 平面 ， 采 集 过 程 中 
发 生 的 主要 运动 为 位 于 冠状 面 与 撩 状 面 的 运动 ，。 

当 姿 态 发 生 冠 状 面 的 变化 时 ， 如 猪 左右 扭头 和 
左右 转 刁 ， 两 侧 的 质心 偏 移 距离 的 变化 会 比较 剧 
烈 ， 奋 将 此 时 猪 青 假 设 为 弧 形 ， 质 心 大 幅 向 弧度 的 
中 心 移动 ， 由 于 质心 的 初始 位 置 为 接近 猪 背 部 中 心 
点 ， 所 以 猪 前 侧 和 后 侧 与 质心 的 距离 减 小 ， 中 心 处 
与 质心 的 距离 增加 ， 同 时 两 侧 的 减 小 量 比 中 心 的 增 
加 量 要 更 大 ; 而 全 局 特征 点 在 学 习 过 程 中 会 发 生 沿 
猪 的 背 浓 走向 移动 的 整体 倾向 ， 此 时 偏 移 距 离 变 化 


BX ,, IPARA M SIE : 

设 3 行 n 列 的 背部 点 云 向 量 组 为 M，3 行 n 列 的 
偏 移 向 量 组 为 用 ， 质 点 为 G。 

了 XX, 的 第 一 维度 表示 为 公式 (8)。 

Xa 7 fi, = (M2, Mi, + Mj, (8) 

式 中 : X ,是 每 个 点 到 关键 点 的 距离 ; m8 
TMH 

X, 的 第 二 维度 表示 为 公式 (9). 

Xa, -m,-g8gi- 13 (M,, = GY (9) 

UP: XQ 是 每 个 点 到 质心 的 距离 ; mST 
M 的 点 ; 8 为 质点 。 

加 入 质心 和 全 局 特征 点 偏 移 的 X, 为 神经 网 络 中 
引入 了 关于 猪 体 大 小 和 姿态 的 信息 。 当 猪 的 大 小 不 
同时 ， 两 种 偏 移 值 的 整体 都 会 相应 的 产生 变化 。 同 
时 ， 马 也 蕴含 了 猪 的 运动 姿态 信息 。 


b. Back Encoder 


c. Back-Attention 


较 小 的 部 分 为 移动 较 少 的 部 分 ， 隐 式 地 表述 猪 发 生 
运动 的 关节 位 置 。 

当 猪 姿态 发 生 矢 状 面 变化 时 ， 如 猪 低头 、 拾 
头 、 马 背 ， 由 于 网 络 中 只 使 用 了 猪 背部 点 云 ， 因 此 
对 于 中 心 的 质心 偏 移 量 影 响 会 更 大 ， 此 时 的 前 后 侧 
偏 移 距 离 也 是 具有 前 侧 和 后 侧 与 质心 距离 减 小 ， 中 
部 点 与 质心 距离 增加 的 趋势 ， 同 时 两 侧 的 减 小 量 比 
中 心 的 增加 量 更 小 ; 全 局 特征 点 在 此 时 会 向 中 心 收 
缩 ， 导 致 全 局 偏 移 量 和 质心 偏 移 量 的 相似 度 提高 。 

最 终 ，X 可 以 在 其 张 量 空间 上 通过 距离 隐 式 含 
有 猪 的 不 同 姿势 和 大 小 信息 。 

Back Transformer 通 过 两 层 连 续 的 编码 器 组 成 。 
编码 器 结构 改进 为 同时 输出 提取 到 点 云 的 特征 和 距 
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离 特 征 ， 同 时 注意 力 部 分 使 用 了 改进 的 back atten- 
tion 结构 。back attention 的 设计 如 公式 (10) 和 公 
式 (11) 所 示 。 
Atin,( X, X.) = 
(XW,,)( X, Wi) 


p pk 


/[D. 


sm| mp| sm > SM 


x(X,W,) 


(X.W.,)(XWa) | 
D, 


p 


Attention ,( X,) = softmax 


(11) 

式 中 : X, Xara Ay f HZ VE ee A BS 
和信 得 到 的 特征 ; 琵 为 权 值 敌阵 ; 刀 为 维度 。 

相 比 self attention 结构 ，back attention JIILA. T HE 
离 信息 作为 额外 的 注意 力 来 源 。 与 edge attention 中 
的 释 加 自 注意 权 值 的 做 法 不 同 的 是 ，back attention 
中 对 X, 和 XX 的 自 注意 力 权 值 进行 了 按 位 max pool- 
ing 的 操作 ， 采 用 max pooling 的 原因 是 X, 蕴 含 了 足 
够 的 信息 ， 使 其 产生 的 自 注意 力 具 备 较 强 代 表 性 ， 
所 以 通过 max pooling 后 得 到 的 自 注 意 力 权 值 可 以 
同时 兼顾 对 求解 关键 点 需要 的 全 局 信息 、 相 对 位 置 
言 息 和 姿态 信息 。 

在 Back Transformer 提取 完 成 特征 后 ， 通 过 两 
层 的 MLP 得 到 17 个 偏 移 量 ,再 将 偏 移 量 与 全 局 特 
征 点 求 和 ， 模 型 最 终生 成 17 个 点 (图 11)， 其 中 6 
个 测量 关键 点 p1~pe。 和 11 个 背 疹 走 向 点 pj;~p17。 

3) 标记 与 损失 水 数 

本 研究 中 每 个 猪 背 部 点 云 标记 了 6 个 测量 关键 


pi 4 
NU HET 
Aue ELIO 


ia ne i 


b. E77 ^E jx, 65 33 4E E 161 
图 11 Pig Back Transformer 模 型 生成 的 关键 点 
Fig. 11 Key points generated by Pig Back Transformer 


点 和 多 个 背 消 走向 点 ， 如 图 12 所 示 ， 测量 关键 点 
从 头 至 尾 依次 为 : 体 长 测量 起 点 ， 前 体高 、 肩 宽 关 
键 点 ， 胸 围 关键 点 ， 腹 围 、 腹 宽 关 键 点 ， 后 体高 、 
辟 宽 关键 点 ， 以 及 体 长 测量 终点 。 

后 体高 、 蔷 宽 关 键 点 


体 长 测量 起 点 胸围 关键 点 


WIESO HR 


前 体高 、 房 宽 关 键 点 。 腹 围 、 腹 宽 关 键 点 


a. 人 工 标 记 的 测量 关键 点 


b. 人 工 标记 的 背 瑚 走向 点 
图 12 人 工 标记 的 测量 关键 点 和 背 汰 走向 点 
Fig. 12 Human marked measurement key points and spine 


direction points 


损失 函数 包含 三 个 目标 。 第 一 个 目标 是 最 小 化 
生成 的 点 和 人 工 标注 的 测量 关键 点 的 距离 ; 第 二 个 
目标 是 按 顺 序 生 成 尽 可 能 近 的 脊背 点 ; 第 三 个 目标 
是 降低 相 邻 生成 点 间距 的 方差 ,缩小 方差 可 以 使 生 
成 点 的 分 布 更 加 均匀 ， 均 匀 的 分 布 可 以 使 生成 点 对 
背 疹 线 的 拟 合 程 度 更 高 ， 提 高 体 尺 计算 精度 。 

损失 函数 如 公式 (12). ~ 公式 (18) 所 示 。 

Loss = Loss, + Loss, + Loss, (12) 


6 
Loss, = Sk = gill, (13) 
iz1 


式 中 : 大 表示 第 ;个 生成 点 ; g, 表 示 第 i 个 人 工 
标记 的 测量 关键 点 ; Zoss; 为 生成 的 6 个 测量 关键 点 
和 人 工 标记 的 6 个 测量 关键 点 对 应 的 距离 。 


Loss, (Ik, els +(k.-e,)(k “FCI -0) ) (14) 


J Vu 
|bvill: X 


0 p= kim kiisti m AS, & OS) 


lud" 

KH: e k 5 A Tie SEXE IL LAS HP I 
最 近 点 ; fk 5 A TiO S GE n BEA ESL 
WA; |Ik- ei|| 表 示 每 个 点 与 躯干 上 最 近 点 的 距 
离 ， 用 来 约束 生成 点 的 精度 ; (k-e) X (k -fK 
示 的 是 生成 的 点 和 躯 干 的 偏差 ， 用 来 约束 生成 的 点 
落 在 Ground Truth 走向 上 的 程度 ; (1 - 9,) 表示 的 
是 生成 点 间 连 线 的 方向 是 否 一 致 ， 用 来 约束 生成 点 
的 顺序 。 
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Loss, = (k = dj) (16) 部 关键 点 , 分 别 位 于 两 耳 中 心 和 尾部 末端 ， 绿色 为 
dbr SE +p Ae Er 
d, = |; - kl) (17) 背部 曲线 拟 合 点 。 
d; 
ar a (18) 


式 中 : d Ak, ALA K,, [ASHES ; 为 相 邻 点 
之 间 的 平均 距离 ; (天 - d,) 为 相 邻 点 间距 离 的 方差 ， 
用 来 约束 生成 点 的 均匀 性 ， 当 点 越 均 匀 时 相 邻 点 之 
间 的 平均 距离 的 方差 越 小 ， 此 时 肉 背 线 走向 点 的 分 
布 更 加 均匀 。 
122 ERF 

本 人 研究 依据 Pig Back Transformer 产 生 的 体 尺 关 
键 点 和 背 兰 走向 点 ， 设 计 了 对 应 的 求 体 长 Bip 
mi. Wee .JHSE. SE. BS. OR. BAY 
算法 。 

开始 体 尺 计算 前 ， 首 先 要 将 地 面 调整 到 xOz 平 
面 ， 计 算 模 型 生成 点 在 5, 的 最 近 点 集合 1， 并 使 用 
RANSAC (Random sample consensus) 算法 "” 拟 
Ar 5 Bl IE 7; fe, ORES, 和 7 根据 地 面 方程 旋转 ， 使 
地 面 法 向 量 平行 于 y 轴 且 与 x0z 平 面 距离 为 0。 

1) 体 长 关键 点 如 图 13 所 示 ， 红 色 为 头 部 和 尾 


MiraN TR isa ue: memo wami SORTER 


a. 俯视 角 体高 测量 点 和 切片 区 域 b. 俯视 角 体 宽 测 量 点 和 切片 区 域 


e. 侧 视角 前 后 体高 测量 点 


f. 侧 视 角 体 宽 测量 点 


图 13 Pig Back Transformer 模 型 的 猪 体 长 关键 点 与 拟 合 曲线 
Fig. 13 Key points for pig body length calculating & the fitting 


curve in Pig Back Transformer model 
SK Fe AY WU tt Ep, po LISA AED 
pr~pw 和 背部 点 云 都 投影 到 xOy 平 面 上 ， 对 头 尾 关 
键 点 和 11 个 背 疹 走 向 点 的 投影 进行 最 小 二 乘 拟 合 背 
将 走向 曲线 ,再 以 2 cm 为 间隔 在 曲线 上 取得 曲线 
和 点 云 投影 最 近 点 点 集 J， 将 7 映射 回 背部 点 云 得 
到 KK， 体 长 为 K 的 点 间距 之 和 。 


T-1 
Length — Y; - kill; 
i=l 


2) 体高 关键 点 如 图 14a 所 示 ， 左 侧 为 前 体高 测 
量 点 ， 位 于 肩 腥 中 心 ， 右 侧 为 后 体高 测量 点 ， 位 于 


(19) 


Ls 


测量 点 和 切片 区 域 


MU) dc 


c. 入 视角 胸围 测量 点 和 切片 区 域 d. 俯视 角 腹 有 


i. 3 : 


g. MAKANE SHH CX 


h. 侧 视角 腹 围 测量 点 和 切片 区 域 


图 14 体 尺 算法 中 的 猪 体高 体 宽 、 胸 围 腹 围 关 键 点 和 切片 区 域 


Fig. 14 Key points & slicing area for height, width, chest circumstance and abdomen circumstance in body size calculation algorithm 


前 体高 为 前 体高 关键 点 处 沿 垂直 于 走向 曲线 做 
切片 得 到 集合 Xi 中 前 10% 高 点 的 平均 高 度 : 
Hi = max( y(x,)),x eX... (20) 
后 体高 为 后 体高 关键 点 处 沿 垂直 于 走向 曲线 做 
切片 得 到 集合 Xs 中 前 10% 高 点 的 平均 高 度 : 
Hy = max[y ox € X par (21) 
3) 体 宽 关键 点 如 图 14b 所 示 ， 从 左 到 右 依次 
TDA Si. vn. EN 
肩 宽 计 算 方法 为 在 肩 宽 ;关键 点 处 沿 垂直 于 走向 
曲线 做 切片 得 到 集合 C， 并 旋转 切片 集合 ， 使 切片 
集合 平行 于 xOy 平 面 ， 再 等 间距 地 分 割 切片 得 到 7 
个 集合 C…C,， 在 每 个 集合 中 存在 W,= 


max (x(C,)) 一 min(x(C,)), 前 体 宽 即 为 max (W,). 
测量 截面 如 图 15a 所 示 。 

腹 宽 计算 方法 为 在 腹 宽 关键 点 处 使 用 与 肩 宽 
同 算法 得 到 。 测 量 截 面 如 图 15b 所 示 。 

绒 宽 计算 方法 为 在 丑 宽 关键 点 处 使 用 与 肩 
同 算法 得 到 。 测 量 截 面 如 图 15c 所 示 。 

4) 胸围 算法 为 在 图 14c 所 示 的 胸围 关键 点 处 
沿 垂直 于 走向 曲线 做 切片 得 到 点 集合 刀 ， 用 体 素 降 
采样 降低 点 云 密 度 ， 再 旋转 切片 集合 使 其 平行 于 
xOy 平 面 ， 将 DD 投影 到 xOy 平 面 ， 用 统计 方法 去 除 
切片 中 的 腿 部 部 分 ， 再 将 投影 后 的 点 转换 为 极 坐 
标 ， 通 过 拟 合 极 坐标 曲线 进行 近似 补 全 ， 最 后 将 极 
坐标 转换 回 平面 直角 坐标 系 得 到 如 图 16 所 示 的 闭 


宽 相 
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Fig. 15 Slice for shoulder, abdomen and hip width calculation in width calculation process 
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图 16 胸围 计算 过 程 中 的 胸围 曲线 拟 合 结果 
Fig. 16 Fitting results of chest circumference 
5) 腹 围 算法 为 在 图 14d 所 示 的 腹 围 关键 点 处 
做 与 胸围 相同 算法 ,得 到 如 图 17 所 示 的 闭合 曲线 
lim， 使 用 微 元 法 计算 闭合 曲线 1 的 长 度 Coa BIOS 
腹 围 计算 结果 。 


2 实验 结果 与 分 析 


实验 使 用 的 硬件 为 AMD Ryzen Threadripper 


投影 点 
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图 17 猪 腹 围 曲线 拟 合 结果 


Fig. 17 Fitting curve of pig's abdomen circumference 


PRO 3995WX CPU fll RTX 3090 GPU, ERAN 
Linux， 神 经 网 络 框架 为 Pytorch。 


2.1 边缘 提取 


边缘 提取 实验 前 先 对 点 云 进行 体 素 大 小 为 0.01 
的 体 素 降 采样 ， 再 使 用 最 远 点 降 采 样 将 点 云 降 采 样 
至 2 048 个 点 提升 计算 速度 。 

边缘 提取 效果 如 图 18 所 示 ， 可 以 看 出 本 研究 
提出 的 边缘 提取 算法 提取 出 了 猪 背 部 点 云 的 边缘 ， 
泛 化 性 较 强 ， 可 以 用 于 不 同 姿态 下 的 猪 背 部 点 云 。 


-~ RS US. em t, ‘aad eee atm tt meos 
Cote o p c 
CU ou (sime es Se nodi % iind O 
a. 标准 姿态 的 边缘 提取 结果 b. 部 分 缺失 的 边缘 提取 结果 c. 大 幅 雇 曲 姿态 的 边缘 提取 结果 


图 18 顶部 视角 猪 背 部 点 云 的 边缘 提取 结果 

Fig. 18 Results of edge detection for pig back's point cloud captured from top angle 

但 是 ， 从 图 19 所 示 的 侧 视角 可 以 看 到 ， 点 云 
边缘 的 曲率 变化 剧烈 、 连 续 性 较 差 ， 在 使 用 Shared 
MLP 对 边缘 点 云 提取 特征 时 ， 如 果 不 对 点 云 边 缘 进 
行 预 处 理 , 会 导致 训练 过 程 中 边缘 点 中 提取 的 特征 
不 具有 代表 性 ， 影 响 网 络 的 性 能 和 训练 时 的 稳定 
性 ， 此 问题 出 现 的 原因 是 Shared MLP 会 对 输入 的 


图 19 顶部 视角 猪 背 部 点 云 的 边缘 提取 结果 的 侧面 
Fig. 19 Side view of the result of edge detection for pig back's 


point cloud captured from top angle 


点 云 中 的 所 有 点 进行 相同 的 线性 映射 ， 所 以 当 样 本 
相似 度 较 低 时 有 可 能 出 现 欠 拟 合 现象 。 
而 在 经 过 修剪 后 的 边缘 提取 结果 如 图 20 所 示 ， 


连续 性 更 强 ， 边缘 更 平整 ， 受 猪 的 姿态 影响 更 小 ， 
在 神经 网 络 训练 时 性 能 更 好 ， 稳 定性 更 强 。 
在 后 续 的 神经 网 络 训练 实验 中 进一步 量化 修剪 
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rd ` 


b. 修剪 后 的 边缘 侧 视 图 


图 20 顶部 视角 猪 背 部 点 云 的 修剪 后 的 边缘 提取 效果 
Fig. 20 Edge detection result after trimmed for pig back's point 


cloud captured from top angle 
与 否 的 稳定 性 和 性 能 差异 。 
2.2 关键 点 生成 


在 关键 点 生成 实验 中 ，Pig Back Transformer ft 
型 参数 量 为 10 M， 数 据 集 为 前 文 介绍 的 人 工 标 记 
的 810 组 数据 ， 通 过 旋转 、 轴 对 称 操作 将 数据 增强 


到 4 050 个 点 云 。 
2.2.1 与 其 他 模型 的 对 比 


实验 所 用 模型 性 能 如 表 1 所 示 。 表 1 中 数据 显 
示 出 实验 所 用 的 模型 中 ，PointNet++ 的 生成 点 均匀 
度 较 好 ， 但 测量 关键 点 和 背 兰 走向 点 的 平均 偏差 较 
高 ; Point Transformer V2 fil jill] E: X pE 5 REL E 3E [8] 
点 生成 精度 高 于 PointNet+t+ ， 均 匀 度 和 了 PointNet++ 
持平 ，Point Cloud Transformer 的 精度 和 均匀 度 都 略 
差 ; OctFormer 的 关键 点 和 背 疹 走向 点 精度 较 高 ， 
均匀 度 表 现 为 实验 中 最 好 ; PointTr 的 精度 和 均匀 度 
都 较 高 ; Pig Back Transformer 精 度 表 现 最 好 ， 均 匀 
度 较 高 。 

关键 点 与 背 兰 走 向 点 生成 效果 如 图 21 所 示 ， 
PointNet++ 的 生成 点 均匀 度 较 好 ,但 关键 点 和 走 问 

表 1 不 同 模型 的 关键 点 拟 合 结果 
Table 1 Key points generated by different models 


模型 Loss icc m 点 间距 方差 

PointNet++ 0.061 — 0.009 0.001 5 8.7 

Point Transformer V2 — 0.052 — 0.008 0.0005 11.0 
Point Cloud Transformer?" 0.074 0.012 0.0021 10.5 
OctFormer 221 0.037 0.005 0.00010 — 11.8 

PoinTr ^! 0.082 0.013 0.00018 10.1 

Pig Back oo 无 边缘 0091 0.015 0.0015 9.8 
Pig Back Transformer 0.013 0.002 0.001 1 10.3 


注 : 加 粗 为 性 能 最 好 。 


点 的 平均 偏差 较 高 ，OctFormer 的 关键 点 和 走向 点 
平均 偏差 都 较 低 ， 均 匀 度 表现 为 实验 中 最 好 ，Pig 
Back Transformer 精度 表现 最 好 ， 均 匀 度 满足 测量 


b. PointNet++ 


c. OctFormer d. Pig Back Transformer 


图 21 Point++, OctFormer, Pig Back Transformer 关 键 点 和 
HO AA) RAS BOR Fo A Tit e E 

Fig. 21 Key points & pig spine direction points generated by 

PointNet++, OctFormer, Pig Back Transformer compare with 


manual labeling 


2.2.2 ”消融 实验 

消融 实验 如 网 22 所 示 。 在 去 除 掉 边缘 提取 模 
块 ， 并 将 自 注意 力 机 制 修 改 为 传统 的 Transformer 
后 ， 直 接 使 用 背部 点 云 进行 关键 点 生成 时 ,稳定 性 
和 拟 合 效 果 都 大 幅 下 降 。 在 去 除 掉 边缘 修整 处 理 
后 ， 点 云 的 训练 速度 和 拟 合 效果 都 发 生 了 下 降 ， 并 
且 在 训 人 到 了 很 大 的 影响 。 


| il 
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b. 点 云 修剪 的 消融 实验 
图 22 边缘 提取 和 点 云 修剪 的 消融 实验 
Fig. 22 Ablation experiment of edge detection and point cloud trim 


生成 关键 点 精度 的 任务 上 ，Pig Back Trans- 
former 相 对 其 他 点 云 处 理 网 络 得 到 了 提高 ， 并 且 达 
到 了 体 尺 计算 所 需 精 度 。 
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2.3 体 尺 计算 象 ， 导 致 误差 不 稳定 ， 故 前 体高 有 较 高 的 误差 标 
准 差 。 

2.3.1 与 人 工 测量 结果 对 比 Xd 


选取 了 第 一 次 采集 的 20 头 猪 体 ， 使 用 每 头 猪 
10 个 点 云 计算 体 尺 数据 并 取 平 均值 作为 体 尺 计算 结 
果 并 与 人 工 结果 进行 对 比 ( 表 2)。 
表 2 Pig Back Transformer 模 型 体 尺 计算 结果 与 人 工 体 尺 
测量 的 误差 
Table 2 Error comparing body size calculated by Pig Back 


Transformerwith human measured result 


体 尺 类 型 T1 2 平均 误差 /cm 最 大 误差 /cm 误差 标准 差 
误差 /% 

本 长 0.63 0.729 1.982 0.079 
前 体高 1.85 1.132 2.264 2.199 
后 体高 2.38 1.610 3.395 0.678 

H bi 2.68 0.832 2.264 2.348 

i vu 1.22 0.369 0.851 0.435 

TEES, 5.46 1.747 3.608 1.194 

向 围 4.02 4.200 3.170 2.910 

f Fi 3.95 4.585 2.966 2.831 


结果 表明 ， 体 长 的 相对 和 平均 误差 结果 较 好 ， 
但 由 于 猪 体 变化 导致 的 最 大 误差 仍然 较 高 。 当 猪 体 
发 生 冠状 面 变化 时 ， 体 表皮 肤 会 发 生 拉 伸 ， 对 此 时 
采集 到 的 点 云 进行 体 长 计算 会 产生 较 大 的 误差 。 

前 体高 平均 误差 和 最 大 误差 都 好 于 后 体高 ， 但 
标准 差 比 后 体高 更 高 ， 产 生 这 种 现象 的 原因 是 算法 
设计 过 程 中 未 考虑 猪 在 行走 过 程 中 后 体高 测量 处 出 
现 肌 肉 隆 起 ， 导 致 整体 存在 较 高 的 误差 。 前 体高 平 
均 误差 较 低 ,但 是 偶 有 发 生 在 行走 过 程 中 低头 的 现 


宽 的 平均 相对 误差 、 平 均 误 差 、 最 大 误差 和 

误差 标准 差 结 果 相 对 肩 宽 和 辟 宽 都 更 好 ， 产 生 这 种 
现象 的 原因 有 两 点 : 一 是 猪 体 发 生 姿态 变化 时 腹 宽 
相对 肩 宽 与 辟 宽 发 生 的 变化 会 更 小 ;二 是 肩 宽 与 辟 
宽 的 截面 截取 算法 在 应 对 姿态 改变 时 需要 优化 ， 由 
于 行走 时 腿 部 连 线 并 不 垂直 于 背脊 线 ， 所 以 算法 所 
截 平面 与 实际 物理 平面 存在 误差 。 

胸围 与 腹 围 的 测量 结果 都 较 差 ， 是 由 于 两 侧 相 
机 视角 与 地 面 的 相对 高 度 较 高 ， 部 分 点 云 出 现 了 的 
较 大 范围 的 腹部 和 胸部 空洞 ， 这 些 空洞 导致 通过 极 
坐标 最 小 二 乘 拟 合 算法 得 到 的 胸部 、 腹 部 曲线 与 猪 
体 实 际 的 物理 形状 相差 较 大 ， 因 此 产生 了 较 大 的 
误差 。 
2.3.2 ” 猪 体 姿态 剧烈 变化 对 体 尺 的 影响 

由 于 猪 体 姿态 会 影响 点 云 的 体 尺 测量 结果 ， 本 
研究 从 第 一 次 采集 的 20 头 猪 体 中 选取 了 背 浴 走向 
曲率 最 高 的 10 头 猪 ， 每 头 猪 10 个 点 云 进 行 同一 头 
猪 不 同 姿 势 的 体 尺 分 布 实验 ， 以 测试 本 模型 在 不 同 
姿态 下 体 尺 测量 的 稳定 性 。 计 算 结 果 如 表 3 和 表 4 
所 示 ， 分 布 结果 如 图 24 所 示 ， 在 进行 体 长 计算 时 ， 
本 模型 结果 较为 集中 ， 浮 动 范 围 在 3 cm 以 内 , 在 
极端 情况 下 因 运 动 幅 度 过 大 会 产生 少数 的 异常 值 ， 
在 进行 腹 宽 计算 时 ， 由 于 腹 宽 相对 体 长 基数 较 小 ， 
因此 本 模型 结果 在 数值 上 会 更 为 集中 ， 浮 动荡 围 在 
1 cm 左右 ， 相 对 浮动 则 都 在 3 多 左右 。 


表 3 猪 姿态 剧烈 变化 时 的 体 长 测量 结果 
Table 3 Body length results when pig's posture changed significantly 


编号 2 3 4 5 6 7 8 9 10 
人 工 测量 结果 /cm 102.0 100.0 111.0 120.0 108.0 115.0 115.0 116.0 127.0 129.0 
结果 1/cm 102.5 99.1 111.1 121.1 108.4 114.1 115.0 116.3 127.4 128.9 
结果 2/cm 102.2 100.1 112.1 119.5 108.1 114.4 114.0 116.0 128.9 130.4 
结果 3/cm 101.1 98.8 109.8 119.0 108.9 113.3 113.8 116.5 128.8 128.6 
结果 4/cm 102.1 109.0 109.4 118.4 107.2 114.7 114.6 116.2 127.6 129.4 

ZAAN O/cm is E n " t 5 D id E i 
结果 5/ 101.5 101.1 109.9 118.3 109.0 115.1 114.2 116.0 128.4 128.6 
结果 6/cm 100.1 101.2 109.8 119.2 108.0 115.5 115.8 116.4 128.6 130.7 
结果 7/cem 102.0 100.8 109.8 119.3 108.5 115.0 115.6 114.3 128.7 130.8 
结果 8/cm 103.9 100.9 109.0 119.3 109.5 115.5 115.2 115.4 128.8 129.2 
结果 9/em 102.9 100.5 109.9 119.0 108.2 115.2 115.6 117.4 128.2 130.0 
结果 10/cm 102.8 99.4 111.0 119.4 108.8 114.9 115.9 116.9 128.6 129.4 

3 it it 第 一 是 未 使 用 公共 数据 集 进 行 关键 点 生成 实验 。 公 


3.1 Pig Back Transformer 实 验 中 的 不 足 
Pig Back Transformer 的 实验 中 存在 两 点 不 足 。 


开 数 据 集 的 多 样 性 能 对 模型 的 泛 化 性 进行 更 充分 的 
测试 ， 同 时 使 用 公开 数据 集 进行 实验 结果 会 更 具有 
公信 力 ， 但 两 个 问题 导致 了 无 法 使 用 公开 数据 集 进 
行 实验 : 首先 ， 目 前 公开 数据 集中 的 关键 点 均 为 关 
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表 4 猪 姿态 剧烈 变化 时 的 腹 宽 测量 结果 
Table 4 Abdomen width results when posture changed significantly of pig 
编号 1 2 3 4 5 6 7 8 9 10 
人 工 测量 结果 /cm 25.0 25.0 27.0 30.0 27.0 38.0 29.0 27.0 30.0 35.0 
结果 l/cm 25.1 24.5 27.8 30.1 26.5 38.1 29.5 27.2 31.0 35.5 
结果 2/cm 25.1 24.4 21.5 29.4 26.4 38.0 29.4 27.3 30.8 35.1 
结果 3/cm 25.2 24.4 27.4 30.2 26.6 38.0 29.4 27.1 30.8 35.1 
结果 4/cm 25.3 24.3 27.6 30.1 26.5 38.0 29.4 27.2 30.7 35.5 
结果 S/em 25.5 24.5 27.8 30.1 26.2 37.8 29.5 27.0 31.1 36.3 
结果 6/cm 24.9 24.1 27.8 29.9 26.5 37.8 29.0 27.2 30.8 35.5 
结果 7/cm 24.9 24.5 27.4 30.0 26.1 37.7 29.0 27:2 30.5 35.7 
结果 8/cm 24.5 24.6 27.2 30.4 26.5 38.1 29.3 27.2 30.6 34.2 
25 FE 9/cm 25.0 24.6 21.2 30.1 26.5 38.2 29.6 27.3 30.8 35.5 
结果 10/cm 24.5 24.7 27.2 30.0 26.4 38.1 29.2 27.3 30.7 35.5 
130 pË # 像素 上 与 点 云 一 一 对 应 ， 并 且 上 自身 存在 结构 化 信 
= 息 ， 可 以 使 用 二 维 计算 机 视觉 方法 如 YOLO 等 进行 
5 ` M A a 
g^ T & B 关键 点 检测 REL BR ER ie ERATES z P BART 
Ü mus. #2 i :半生 ; A WES i 
fad .é i» + 应 点 即 可 进行 体 尺 计算 ， 但 是 点 云 作为 经 过 相机 内 
= "ue + 参 转 换 的 深度 图 蕴含 了 相机 内 参 ， 而 使 用 深度 图 和 
100! & SIE a. 二 维 图 像 进行 目标 检测 则 缺少 这 部 分 信息 。 第 二 ， 
JE. EXER PTS "es pU Sol 利用 深度 图 与 点 云 一 一 对 应 的 关系 , 将 降 噪 和 去 除 
a 体 长 分 布 b. 腹 宽 分 布 背景 后 的 点 云 结构 化 并 利用 机 构 化 信息 提高 特征 提 


图 23 猪 姿态 剧烈 变化 时 的 体 长 和 腹 宽 分 布 
Fig. 23 The distributed of body length and abdomen width 


when pig's posture changed significantly 


键 点 配对 任务 ， 与 本 研究 所 需 的 提取 测量 关键 点 任 
务 不 同 ， 无 法 作为 本 研究 的 性 能 指标 ， 也 无 法 进行 
迁移 ; 其 次 ， 本 研究 采用 了 点 云 边 缘 提 取 ， 因 为 观 
察 到 猪 背 部 点 云 的 边缘 蕴含 的 几何 信息 对 整个 猪 背 
部 点 去 具有 代表 性 ， 而 公开 数据 集 则 不 符合 此 情 
况 。 第 二 是 由 于 边缘 提取 部 分 与 编码 器 设计 耦合 程 
度 太 高 ， 导 致 边缘 提取 模块 和 注意 力 机 制 的 消融 实 
验 无 法 独立 进行 。 
3.2 Pig Back Transformer 模型 的 不 足 和 改 

进 方 向 

本 模型 的 不 足 之 处 有 两 点 。 第 一 是 自动 化 程度 
仍 存在 提高 空间 ， 由 于 构建 训练 集 时 采用 人 工 剔 除 
掉 不 完整 点 云 ， 若 直接 将 本 模型 应 用 在 生产 环境 
中 ， 便 需要 人 工 确定 猪 体 点 云 是 否 超出 摄像 机 采集 
范围 。 第 二 是 对 点 云 形状 的 兼容 范围 不 够 广 ， 由 于 
采用 了 边缘 提取 作为 部 分 输入 ， 算 法 的 适用 范围 为 
某 一 视角 的 点 云 存 在 足够 提取 出 稳定 的 全 局 关键 点 
的 几何 信息 。 

模型 存在 四 个 可 改进 方向 。 第 一 ， 通 过 深度 图 
和 同时 拍摄 的 二 维 图 像 进行 关键 点 检测 。 深 度 图 在 


取 性 能 。 第 三 ， 可 以 通过 投影 的 方法 提升 模型 的 适 
用 范围 ， 将 完整 点 云 分 别 投影 到 不 同 视角 ， 如 投影 
到 xOy，yOz，xOz 平 面 ， 再 进行 不 同 视 角 下 的 边缘 
提取 ， 最 后 通过 多 视角 下 的 边缘 点 集 输 入 模型 生成 
关键 点 。 第 四 ， 设 计算 法 检测 猪 体 点 云 是 否 超 出 摄 
像 机 采集 范围 ， 自 动 构 建 模型 训练 所 需 数 据 集 ， 同 
时 提高 生产 环境 中 的 自动 化 程度 。 

4 结 论 

本 人 研究 设计 的 关键 点 生成 模型 Pig Back Trans- 
former 有 和 较 高 的 关键 点 生成 精度 ， 相 对 其 他 的 点 云 
处 理 网 络 有 和 较 大 提升 ， 关键 点 平均 偏差 为 0.2 cm, 
解决 了 猪 体 尺 测 量 中 的 关键 点 定位 和 和 背 崔 走向 拟 合 
问题 。 依 托 体 尺 测量 关键 点 构建 的 体 尺 算法 在 体 
长 、 体 高 、 体 宽 测 量 上 获得 了 较 高 精度 ， 体 长 的 平 
均 相 对 误差 为 0.63%， 相 对 其 他 研究 方法 有 较 大 提 
升 。 同 时 ， 提 出 的 算法 能 较 好 地 处 理 动物 运动 过 程 
中 体态 的 变化 ,在 姿态 剧烈 变化 下 体 尺 的 分 布 较为 
集中 ， 只 有 少量 异常 值 产 生 ， 有 具有 较 好 的 泛 化 性 ， 
可 以 改善 采集 过 程 中 因 姿 态 变 化 产生 的 体 尺 测量 
误差 。 

综 上 所 述 ， 本 研究 设计 的 种 猪 体 点 云 关键 点 生 
成 模型 ， 提 高 了 关键 点 生成 精度 。 根 据 关键 点 和 背 
部 走向 设计 的 体 尺 计算 算法 ， 降 低 了 无 接触 测量 的 
误差 。 得 到 的 高 精度 无 接触 体 尺 测量 结果 可 以 为 猪 
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育种 工作 提供 坚实 的 数据 基础 。 


利益 冲突 声明 : 本 研究 不 存在 研究 者 以 及 与 公开 
研究 成 果 有 关 的 利益 冲突 。 
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Abstract: 

[Objective] Nowadays most no contact body size measurement studies are based on point cloud segmentation method, they use a 
trained point cloud segmentation neural network to segment point cloud of pigs, then locate measurement points based on them. But 
point cloud segmentation neural network always need a larger graphics processing unit (GPU) memory, moreover, the result of the 
measurement key point still has room of improvement. This study aims to design a key point generating neural network to extract mea- 
surement key points from pig's point cloud. Reducing the GPU memory usage and improve the result of measurement points at the 
same time, improve both the efficiency and accuracy of the body size measurement. 

[Methods] A neural network model was proposed using improved Transformer attention mechanic called Pig Back Transformer for 
generating key points and back orientation points which were related to pig body dimensions. In the first part of the network, it was in- 
troduced an embedding structure for initial feature extraction and a Transformer encoder structure with edge attention which was a 
self-attention mechanic improved from Transformer's encoder. The embedding structure using two shared multilayer perceptron 
(MLP) and a distance embedding algorithm, it takes a set of points from the edge of pig back's point cloud as input and then extract in- 
formation from the edge points set. In the encoder part, information about the offset distances between edge points and mass point 
which were their feature that extracted by the embedding structure mentioned before incorporated. Additionally, an extraction algo- 
rithm for back edge point was designed for extracting edge points to generate the input of the neural network model. In the second part 
of the network, it was proposed a Transformer encoder with improved self-attention called back attention. In the design of back atten- 
tion, it also had an embedding structure before the encoder structure, this embedding structure extracted features from offset values, 
these offset values were calculated by the points which are none-edge and down sampled by farthest point sampling (FPS) to both the 
relative centroid point and model generated global key point from the first part that introduced before. Then these offset values were 
processed with max pooling with attention generated by the extracted features of the points' axis to extract more information that the 
original Transformer encoder couldn't extract with the same number of parameters. The output part of the model was designed to gen- 
erate a set of offsets of the key points and points for back direction fitting, than add the set offset to the global key point to get points 
for pig body measurements. At last, it was introduced the methods for calculating body dimensions which were length, height, 
shoulder width, abdomen width, hip width, chest circumference and abdomen circumference using key points and back direction 
fitting points. 

[Results and Discussions] In the task of generating key points and points for back direction fitting, the improved Pig Back Transformer 
performed the best in the accuracy wise in the models tested with the same size of parameters, and the back orientation points generat- 
ed by the model were evenly distributed which was a good preparation for a better body length calculation. A melting test for edge de- 
tection part with two attention mechanic and edge trim method both introduced above had being done, when the edge detection and 
the attention mechanic got cut off, the result had been highly impact, it made the model couldn't perform as well as before, when the 
edge trim method of preprocessing part had been cut off, there's a moderate impact on the trained model, but it made the loss of the 
model more inconsistence while training than before. When comparing the body measurement algorithm with human handy results, 
the relative error in length was 0.63%, which was an improvement compared to other models. On the other hand, the relative error of 
shoulder width, abdomen width and hip width had edged other models a little but there was no significant improvement so the perfor- 
mance of these measurement accuracy could be considered negligible, the relative error of chest circumference and abdomen circum- 
ference were a little bit behind by the other methods existed, it's because the calculate method of circumferences were not complicated 
enough to cover the edge case in the dataset which were those point cloud that have big holes in the bottom of abdomen and chest, it 
impacted the result a lot. 

[Conclusions] The improved Pig Back Transformer demonstrates higher accuracy in generating key points and is more resource-effi- 
cient, enabling the calculation of more accurate pig body measurements. And provides a new perspective for non-contact livestock 
body size measurements. 


Key words: Pig Back Transformer; 3D point cloud; body size automic measurement; key point positioning; depth camera; self-atten- 
tion mechanism 
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